Transformadores Autoregresivos Visuales Deben Usar Memoria $\Omega(n^2 d)$
Transformadores Visual Autoregresivos con una memoria requerida de orden cuadrático en función del tamaño de entrada y la profundidad del modelo.
Transformadores Visual Autoregresivos con una memoria requerida de orden cuadrático en función del tamaño de entrada y la profundidad del modelo.